Nous montrons ci-dessous que la moyenne est la valeur x la plus proche des observations xi, i=1, …, n lorsque le critère choisi est la somme des carrés des différences entre x et les observations. On montre en même temps une propriété classique de la moyenne.
On considère la fonction dx2 qui mesure la distance entre une valeur x et la suite des observations (xi)i = 1, …, n.
|
|
|
|
|
|
n |
|
dx2 |
= |
f(x) |
= |
[ x – x1 ]2 + [ x – x2 ]2 + [ x – x3 ]2 + ... |
= |
å |
[ x – xi ]2 |
|
|
|
|
|
|
i = 1 |
|
Cette fonction est définie, continue et dérivable pour tout x. Sa dérivée est égale à :
|
|
|
|
|
n |
|
|
f’(x) |
= |
2 [ x – x1 ] + 2 [ x – x2 ] + 2 [ x – x3 ] + ... |
= |
2 n x – 2 |
å |
xi |
|
|
|
|
|
|
i = 1 |
|
|
|
|
|
|
|
1 |
n |
|
|
|
|
= |
2 n [ x – |
––– |
å |
xi |
|
|
|
|
|
n |
i = 1 |
|
On obtient :
f’(x) = 2 n [ x – m ]
La dérivée f’(x) est nulle pour x = m. On a le tableau de variation ci-dessous :
Le tableau de variation montre que la fonction passe par un minimum en x = m.
Une autre façon de montrer cette propriété est d’exprimer f(x) en fonction de f(m) :
f(x) |
= |
[ x – x1 ]2 + [ x – x2 ]2 + [ x – x3 ]2 + ... |
|
= |
x2 – 2 x x1 + x12 + x2 – 2 x x2 + x22 + x2 – 2 x x3 + x32 + ... |
On a de la même façon :
f(m) |
= |
m2 – 2 m x1 + x12 + x2 – 2 m x2 + x22 + x2 – 2 m x3 + x32 + ... |
Calculons f(x) – f(m) en ordonnant les sommes :
f(x) – f(m) |
= |
x2 – 2 x x1 + x12 – ( m2 – 2 m x1 + x12) |
|
+ |
x2 – 2 x x2 + x22 – ( m2 – 2 m x2 + x22) |
|
+ |
x2 – 2 x x3 + x32 – ( m2 – 2 m x3 + x32) |
|
+ |
....... |
Tous les termes de la forme xi2 s’annulent ; il reste, en mettant 2 x et 2 m en facteurs :
f(x) – f(m) |
= |
n x2 – n m2 – 2 x ( x1 + x2 + x3 + ...) + 2 m ( x1 + x2 + x3 + ...) |
On a, par définition de m : ( x1 + x2 + x3 + ...) = n m . On en déduit : :
f(x) – f(m) |
= |
n x2 – n m2 – 2 n x m + 2 n m2 |
f(x) – f(m) |
= |
n ( x2 – 2 x m + m2) |
f(x) – f(m) |
= |
n ( x – m )2 |
Il est clair que f(x) est minimum pour x = m. On obtient la formule classique :
1 |
n |
|
|
1 |
n |
|
|
|
––– |
å |
[xi – x]2 |
= |
––– |
å |
[xi – m ]2 |
+ |
( x – m )2 |
n |
i = 1 |
|
|
n |
i = 1 |
|
|
|